热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

表里|这一点_以后面试官问你为啥不建议使用Select*,请你大声回答他!

篇首语:本文由编程笔记#小编为大家整理,主要介绍了以后面试官问你为啥不建议使用Select*,请你大声回答他!相关的知识,希望对你有一定的参考价值。

篇首语:本文由编程笔记#小编为大家整理,主要介绍了以后面试官问你 为啥不建议使用Select *,请你大声回答他!相关的知识,希望对你有一定的参考价值。


点击关注公众号,实用技术文章及时了解


作者:小目标青年


来源:https://blog.csdn.net/qq_35387940


前言



不建议使用 select  *



这几个字眼,做开发的都不陌生吧。


阿里的开发手册上面也是有提到:



昨晚收到一个小兄弟的反馈:



随后也问了下学习群里的兄弟们,


不敢吱声的:



好像派:



离谱的:



那么,我作为一个出手侠, 我必然要出手了。


出手侠:



习惯用语,等到xxxxx的时候,我就会出手。



正文



其实阿里巴巴手册上说明的三点了:


1) 增加查询分析器解析成本


什么是分析器成本,什么东西,我随手画个简图,大家知道一下:



就是这个分析器,这里会去解析你的sql的语法,词法。


举例,如果是select * from user , 看到 * ,就会去看看是哪个表 user,然后 Query Table Metadata For Columns,把所有列值给你支楞出来,填充成类似  select id ,name ,age,phone form user 这样子。(当然还有其他分析了,例如如语法的判断, 字段的判断, 表名等等)


说实话。这个分析器的成本....你要是说增加了解析成本,我确实能理解。


但是我感觉成本也不是很大.... 除非是个大表,大到查询完所有列值?


so,我能接受,但是接受得不多。


2) 增减字段,容易与resultMap 配置不一致


这一点我不想说。说实在的,有时候写select *(需要查表所有列值的时候), 我实体加了字段,我改了resultMap ,我sql还不用动。


这一点属于是平时使用规范上的规避点了,不多言。


3)无用字段增加网络消耗、磁盘IO开销


这一点有讲究。


可以看到我第一点里面画的简图, 如果说


不考虑缓存 存在的时候:



最终会走到执行器,然后执行器后面其实是引擎层



引擎层这里我就不展开了,引擎层里面其实包括了各种日志(undo、redo、binlog等)的记录,还有就是在内存里找数据。



简单点归纳,其实这种查询操作就是刷盘操作,从磁盘刷入内存,涉及到的 磁盘IO开销。



那么在刷盘操作的时候,是不是真的selec *  就真的会 增加 磁盘IO开销呢?


答案,肯定是的。但是 增大的影响程度,我必须说一下:



如果你说 ,表里面就三字段 , id ,name ,age  ,本来查 id ,name ;因为 select * ,变成查多了一个 age , 增大磁盘IO开销 ?



我觉得是增大了,但是几乎不用理。因为这些都是正常的数据类型,开销增大不了多少。


所以,真正隐藏的雷是什么?

有大字段


例如


tinytext、text、mediumtext、longtext  
tinybob、blob、mediumblob、longblob

这些家伙,在mysql上,就是当做一个独立的对象处理。


这时候就真的要谨慎了。


如果你是个比较多字段的表,例如什么意见反馈表,留言不确定长度,用了text ,还有回复留言字段也用了text ;


又例如博客文本表,为了存content,用了这些大字段。


本来想查询一下 意见的反馈人名 ,或者是 查询博客的标题,结果因为懒或者不注意,写了select *., 查询的时候带出来这些 大字段。


那么显然,这时候读取的内容数据就是真的比原先初衷要大很多(没准业主小丹投诉保安,意见反馈的留言给你写了篇小论文), 这时候因为读取的内容多,磁盘IO开销多,然后返回数据包给客户端量也多, 这样 就真的是有影响了。


4) 补充,其实也是我首当其冲想说的一点


无法使用索引覆盖


ps:今天学习成语了吗?不要乱用成语。



select * 基本告别索引覆盖了


什么是索引覆盖?

举例 :



给name字段 建索引, 查询的时候,只用到了 索引的字段,这就是索引覆盖 。




也就是直接通过查询索引,拿出来的数据就已经满足了查询返回的字段数据。无需额外其他查询操作了,也就是索引覆盖了。这样肯定快。


如果初衷是查 name, 结果写成了 select * , 变成查多了其他字段, 那其他字段不是索引,肯定无法触发索引覆盖使用场景了,也就是需要额外的回表查询操作了,那这样就慢了。


回归正题,因为写成select * ,变成查多了其他字段, 其他字段不是索引,导致回表,慢。



问题出在哪里? 出在其他字段不是索引?

那么给其他字段都建索引呗,完事了兄弟们。


你们千万不要这么乱搞,索引的维护成本一定是不能忽视的。


涉及到修改新增删除数据时索引的维护成本,索引页的分裂合并等等。索引也是需要存起来的,也是需要占用磁盘空间的。而且如果N个字段都是索引, 随便改动一行数据,需要维护N个索引。


什么概念,就像咱们平时写word文档,搞了个目录,然后底下的2级标题,3级标题,正文啥的,什么分页啥的,乱七八糟操作的编辑,都需要去刷新一下目录。


那么这个索引覆盖影响真的非常大吗?

拿出200W数据的表,删除全部索引,给 platform_sn 单独加索引 :



然后先试试索引覆盖的查询,看看用时,0.02秒 :




接着换成select * :



当然这是 200W 数据的场景下, 不过可以看出,时间差距还是很明显。


0.02  到 0.179 ....


如果我们再加几个大字段?Text ... 那估计就真的离谱了 。


客观总结:


  1. 如果表里有大字段,TEXT 、BLOB系列类型字段, 使用 SELECT * 需要注意

  2. 如果本来只查询某1,2个比较常用的字段的,可以给这些字段建单个索引或者组合索引 ,这时候查询就避免 使用 SELECT *,尽量能触发索引覆盖是最好的了

  3. 如果表字段不多,也没啥特殊字段类型, 而且肯定是查多列的,无法触发索引覆盖的情况下,


我觉得 使用 SELECT * 也无妨,或者写个这种方式方便了,只需要在

推荐阅读
  • ABP框架是ASP.NET Boilerplate的简称,它不仅是一个开源且文档丰富的应用程序框架,还提供了一套基于领域驱动设计(DDD)的最佳实践架构模型。本文将详细介绍ABP框架的特点、项目结构及其在Web API优先架构中的应用。 ... [详细]
  • 浅析python实现布隆过滤器及Redis中的缓存穿透原理_python
    本文带你了解了位图的实现,布隆过滤器的原理及Python中的使用,以及布隆过滤器如何应对Redis中的缓存穿透,相信你对布隆过滤 ... [详细]
  • 秒建一个后台管理系统?用这5个开源免费的Java项目就够了
    秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ... [详细]
  • 在深入掌握Spring框架的事务管理之前,了解其背后的数据库事务基础至关重要。Spring的事务管理功能虽然强大且灵活,但其核心依赖于数据库自身的事务处理机制。因此,熟悉数据库事务的基本概念和特性是必不可少的。这包括事务的ACID属性、隔离级别以及常见的事务管理策略等。通过这些基础知识的学习,可以更好地理解和应用Spring中的事务管理配置。 ... [详细]
  • jQuery Flot 数据可视化插件:高效绘制图表的专业工具
    jQuery Flot 是一款高效的数据可视化插件,专为绘制各种图表而设计。该工具支持丰富的图表类型和自定义选项,适用于多种应用场景。用户可以通过其官方网站获取示例代码和下载资源,以便快速上手和使用。 ... [详细]
  • 在尝试将 mysqldump 文件加载到新的 MySQL 服务器时,遇到因使用保留关键字 'table' 导致的语法错误。 ... [详细]
  • 阿里面试题解析:分库分表后的无限扩容瓶颈与解决方案
    本文探讨了在分布式系统中,分库分表后的无限扩容问题及其解决方案。通过分析不同阶段的服务架构演变,提出了单元化作为解决数据库连接数过多的有效方法。 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • C++ 开发实战:实用技巧与经验分享
    C++ 开发实战:实用技巧与经验分享 ... [详细]
  • REST与RPC:选择哪种API架构风格?
    在探讨REST与RPC这两种API架构风格的选择时,本文首先介绍了RPC(远程过程调用)的概念。RPC允许客户端通过网络调用远程服务器上的函数或方法,从而实现分布式系统的功能调用。相比之下,REST(Representational State Transfer)则基于资源的交互模型,通过HTTP协议进行数据传输和操作。本文将详细分析两种架构风格的特点、适用场景及其优缺点,帮助开发者根据具体需求做出合适的选择。 ... [详细]
  • Spring Boot 实战(一):基础的CRUD操作详解
    在《Spring Boot 实战(一)》中,详细介绍了基础的CRUD操作,涵盖创建、读取、更新和删除等核心功能,适合初学者快速掌握Spring Boot框架的应用开发技巧。 ... [详细]
  • 【前端开发】深入探讨 RequireJS 与性能优化策略
    随着前端技术的迅速发展,RequireJS虽然不再像以往那样吸引关注,但其在模块化加载方面的优势仍然值得深入探讨。本文将详细介绍RequireJS的基本概念及其作为模块加载工具的核心功能,并重点分析其性能优化策略,帮助开发者更好地理解和应用这一工具,提升前端项目的加载速度和整体性能。 ... [详细]
  • 宏基因组学经典文献重现(一):利用ggplot2进行散点图可视化分析
    宏基因组学经典文献重现(一):利用ggplot2进行散点图可视化分析 ... [详细]
  • 利用PaddleSharp模块在C#中实现图像文字识别功能测试
    PaddleSharp 是 PaddleInferenceCAPI 的 C# 封装库,适用于 Windows (x64)、NVIDIA GPU 和 Linux (Ubuntu 20.04) 等平台。本文详细介绍了如何使用 PaddleSharp 在 C# 环境中实现图像文字识别功能,并进行了全面的功能测试,验证了其在多种硬件配置下的稳定性和准确性。 ... [详细]
author-avatar
手机用户2502916905
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有